运用深度学习技术检测转移性乳腺癌
文 / Google AI 医疗保健技术负责人 Martin Stumpe 和产品经理 Craig Mermel
一直以来,病理学家利用显微镜对患者的肿瘤进行微观检查是癌症诊断的黄金标准,而且此方法对癌症的预测和治疗决策也有着深远影响。针对已经从原发部位转移(扩散)到附近淋巴结的癌症检测,是病理学检查中至关重要,却又十分繁重的一环。大多数癌症都涉及淋巴结转移的检测,而这项检测也成为广泛采用的 TNM 癌症分期的基础诊断依据之一。
淋巴结转移会影响有关放射治疗、化疗和可能需要手术切除额外淋巴结等情况的治疗决策,而对于乳腺癌来说尤其如此。因此,准确及时地识别淋巴结转移对临床护理具有重要影响。然而,研究表明,大约有 1/4 转移性淋巴结的分期会在第二次病理检查时发生变化,而且当检查时间有限时,单个载玻片上小范围转移的检测灵敏度可能会降低至 38%。
去年,我们介绍了基于深度学习的方法,以期提高 2016 ISBI Camelyon Challenge 癌症细胞区域检测竞赛的诊断准确性(采用 LYmph Node Assistant,简称为 LYNA)。此竞赛提供了来自乳腺癌患者淋巴结的病理载玻片(高达 10 亿像素),以供研究者开发用于检测转移性癌症的计算机算法。虽然 LYNA 的癌症检测率(Liu 等人的论文,2017 年)明显高于之前的报告,但仅仅依靠准确的算法并不足以改善病理学家的工作流程或乳腺癌患者的治疗结果。为了患者的安全,研究者必须在各种环境下对这些算法进行测试,以了解其优点和缺点。此外,我们之前并未探索过使用这些算法能够为病理学家带来的实际益处,因此必须进行评估,以确定某个算法是否真正能够提高诊断的效率或准确性。
在发表于《病理学和检验医学档案期刊》(Archives of Pathology and Laboratory Medicine) 的论文 “基于人工智能的乳腺癌淋巴结转移检测:对病理学家黑匣子的分析 (Artificial Intelligence Based Breast Cancer Nodal Metastasis Detection: Insights into the Black Box for Pathologists)”(Liu 等人,2018 年),以及发表于《美国外科病理学杂志》(The American Journal of Surgical Pathology) 的论文 “深度学习辅助对转移性乳腺癌淋巴结组织病理学检查的影响 (Impact of Deep Learning Assistance on the Histopathologic Review of Lymph Nodes for Metastatic Breast Cancer)”(Steiner、MacDonald 及 Liu 等人,2018 年)中,我们提出一种基于 LYNA 的概念性病理学验证辅助工具,并对这些因素进行调查研究。
在 第一篇论文 中(http://www.archivesofpathology.org/doi/10.5858/arpa.2018-0147-OA),我们将算法运用于来自 Camelyon Challenge 癌症细胞区域检测竞赛以及我们在圣地亚哥海军医疗中心的共著者提供的独立数据集的反识别病理载玻片。由于这个额外的数据集包含来自不同实验室并采用不同处理过程的病理学样本,所以该数据集提升了常规临床实践中载玻片和人工制品的多样性表征。事实证明,LYNA 能够可靠地运用于图像可变性和大量组织学特征,而且无需进行更多研发,便可在两个数据集中实现相似的性能。
左侧:包含淋巴结的载玻片的样本视图,其中有多个伪影:左边较暗区域是气泡,白色条纹是切割伪影,部分区域的红色显示出血(含有血液),组织已经坏死(衰竭),治疗质量较差
右侧:LYNA 识别出肿瘤区域在中间(红色),并正确地将周围的伪影区域分类为非肿瘤(蓝色)
在两个数据集中,LYNA 能够以 99% 的正确率区分出有转移性癌症的载玻片和无癌症的载玻片。此外,在每个载玻片内,LYNA 能够准确查明癌症及其他可能患有癌症的位置,而其中有些体积太小,病理学家无法通过一贯的做法检测出来。因此,我们推断 LYNA 可能带来的一个好处是突出显示这些有问题的区域,以供病理学家在检查和作出最后诊断时参考。
在 第二篇论文 中(https://insights.ovid.com/crossref?an=00000478-201812000-00007),6 名有美国医生从业执照的病理学家完成了一项模拟诊断任务;他们分别在有和没有 LYNA 辅助的情况下对转移性乳腺癌的淋巴结进行了检查。检测小转移(也称为微转移)通常是一项繁重的工作,而使用 LYNA 平均可缩短一半的检查时间,每张载玻片需要约一分钟的时间,而不再是两分钟,这使人在主观上觉得工作 “更简单”(根据病理学家的诊断难度自我报告)。
这表明 LYNA 等辅助技术的潜力巨大,可以减轻重复识别工作的负担,让病理学家能够有更多时间和精力专注于其他更具挑战性的临床和诊断工作。从诊断准确性方面来看,在此项研究中,借助 LYNA,病理学家能够更准确地检测微转移,并将遗漏微转移的比率降低两倍。令人振奋的是,与未使用 LYNA 辅助的病理学家或仅仅依靠 LYNA 算法本身的情况相比,使用 LYNA 辅助的病理学家能够达到更准确的效果,这表明人们使用算法辅助可使工作更有效率,这比单独使用算法或不使用算法能实现更好的效果。
通过这些研究,我们在展示 LYNA 算法的可靠性(用于支持乳腺癌 TNM 分期的一个组成部分)和评估其在概念验证诊断环境中的影响方面取得了进步。这些进步虽然令人振奋,但利用此类技术帮助医生及患者的科研到临床应用还有很长的路要走。这些研究有很大的局限性,例如,有限的数据库规模和模拟的诊断工作流程仅检查每位患者的单个淋巴结载玻片,而不是完整临床病例中常见的多个载玻片。我们需要进一步评估 LYNA 对实际临床工作流程和患者治疗结果的影响。但是,对于经过仔细验证的深度学习技术和精细设计的临床工具能否改善全球病理学诊断的准确性和实用性,我们仍然保持乐观。
更多 AI 相关阅读: